[レポート] 第3世代BI Lookerの魅力とは(Looker 蓮池 拓哉 氏) – Developers.IO 2019 in TOKYO #cmdevio
今年に入り、日本各地で開催を行っている弊社主催の一大カンファレンス『Developers.IO 2019』。ここまでの開催記録は下記シリーズにてまとめております。
そして2019年11月01日(金)、イベント最大規模となる東京会場にて『Developers.IO 2019 TOKYO』が執り行われました!!
当エントリでは、その中からLooker 蓮池拓哉氏によるランチセッション『第3世代BI Lookerの魅力とは』の内容についてレポートしたいと思います。
目次
セッション概要
登壇者情報は以下の通り。
- 蓮池 拓哉氏/Looker ソリューションコンサルタント
蓮池氏は先日公開した下記インタビューブログでもお話させて頂きました。
セッションレポート
蓮池氏には、イベントの『ランチセッション』の時間でお話頂きました。
自己紹介・企業紹介
- 自己紹介
- 前職(BI系の企業)で導入提案等を行っていた際、Lookerの存在を知る。
- これまでに感じていた課題や問題点等をlookerが日本に来るタイミングで知り、『自分が思っている課題を解決出来そうだ』と思い、今年2019年4月にLookerに入社。
- Lookerってどんな会社?
- ビジネスインテリジェンス&ビッグデータ分析ソフトウェア
- 本社:米国サンフランシスコ/サンタクルーズ、米国を含め、世界各地にオフィスを構える。
- 2018年09月東京オフィス開設。
- ビジネスは2012年から始めており、現在8期目
- 全社員:900人近く、日本法人も年末までには20名となる予定
- お客様
- グローバルなお客様:データをうまく活用しているという印象がある。
- 国内のお客様:下記は許可を頂いているお客様の情報、実際は利用頂いている企業数はもう少しある。キャッチーなところだとメルカリ、ZOZOなど。会社の業態・業種関わらず増えて来ている
- Lookerのミッション
- Lookerのミッション:『データをよりスマートに活用する事によって、ユーザーがより多くのことを行えるようにする』。
- "うち、もうデータ活用出来ているんですよ"と話すお客様、実際聞いてみると可視化・視覚化で留まっているというところも多い。→データ分析の民主化を考えると、視覚化がゴールか?
- データエンジニアリングというところを考えると、データ活用、視覚化というフェーズは一部分でしか無い。
- Lookerは視覚化を含む、青い部分の20%の部分をしっかりやっていく、サポートするというプロダクト。
- 『データ分析の民主化』の前提:データソースが変化し、ボリュームや利用者も増え、データの活用方法も変化する。これを念頭に我々はビジネスを行っている。
第3世代BIとは何か
- 第1世代のBI:
- 単一構成のBI。Microstorategy, Cognos, Oracle BI等のレガシープロダクト
- ETLツールをつかってDWHの中にデータをため、多次元キューブを作ってサーバで処理し描画
- 高度なことも出来るが対応が難しかったり、手間が掛かる
- 第2世代のBI:
- セルフサービス、デスクトップBI。
- ネットが発展し、活動がインターネット上で為されるように。
- デジタル経済加速に伴いデータ量が膨大になるにつけ、やりたいことも増えていく。
- 今まではETLツール経由で集まったデータを、コネクタを使ってデータに接続
- 以前は高価だったが、インメモリ型の処理が出来るようになってきて処理も高速化した→簡単にUIでデータを撮ってきて処理をして描画出来るようになった→データ利用の人たちの種類が変わって・増えてきた世界に
- 皆がデータを使うので、ガバナンスが効かなくなる。自分の思い思いにデータを集めて指標を作ってしまう→データ共有した時に定義のズレが発生してしまうことは良くある
- BIツールの処理基盤にデータを持ってこなければならない
- クラウドとBI
- クラウドデータベースが発展、高速スケーラビリティ安価なDWHが使えるように
- そっち(DWH)側にデータをボンボン貯めていく→インメモリ側の処理基盤が相対的に弱く・処理が遅くなる状況に
- 大量データを分析する状況が難しい時代に
- パイプラインの変遷
- 昨今、SaaSのアプリケーションが増えている
- そして、データの扱いもリアルタイム性が増してきている。この状況に対応/ビジネスユーザーが変わって新しい質問に応えるためには、対象となるデータを都度ETLツールで対応するデータを作り直して...ということが難しくなってくる状況に。
- 最新のETLパイプラインに求められるもの:比較的緩めにデータを貯めていった状態で、そこに対し、自由に分析したい軸に合わせてSQLを色々な角度で生成し、色んなパターンで、ビジネスユーザーの問い合わせに対応していく。Lookerではそんな環境に対応する仕組みが整っている
なぜLookerなのか?
Lookerの特徴は以下の3つ。
1.データのアップロードが無い
- データソースが変化し、増加することを前提とした対応を取ることを行っている
- 第1、第2世代は『自分たちの環境でデータを処理する』ことを考えている
- 一方Lookerは『データ処理はお持ちの高性能DWHにお任せするので、Lookerにはそこで処理した結果をください』というスタンス。
- データを貯めているRedshiftでは高速に結果が返ってくるのにデスクトップ環境が貧弱なので...みたいなのを避ける
- 個人情報の取り扱い、観点からしても(データを持ってこないので)安全
2.LookMLでデータロジックを一元管理
- 第2世代BIはデスクトップツールが主流、ライト&アドホックに出来るようにはなった
- 反面、データやエンジニアリングに対する理解が正しくないと、一貫性の担保が難しくなってきた
- 一貫性が保てなくなるとデータの信頼性も低下→ビジネスの意思決定に活用することにもリスクとなる
- LookerはLookMLを使ってデータロジックを一元管理することで、データの一貫性を担保しながら、品質を上げていくことが可能になっている。
- LookMLを使うことで、シンプルにメンテナンスコストを下げていくことも期待出来る。
3.共有・コラボレーション
- Lookerではデータの活用方法を変えていくことを提唱している
- LookerはWebベースのSaaSのソリューション。色々なツールと簡単につなぐことが出来るようになっている
- 可視化だけでは無く、既にお持ちの業務アプリケーションと連携し、Lookerを用いたデータ分析を皆さんの業務フローの中に組み込んでいくことが出来るようになっていく。
Lookerデモ実演
Lookerに関する特徴等を紹介した後は、実際にサービスを使いながらLookerの機能や良さについて説明するデモを行いました。
- 可視化は想定されるようなケース、Lookerでも大体のことは出来る
- 可視化だけにとどまらず、『次のアクション』が行えるような仕組みも多数扱える(デモではEメール展開、Slack連携などを実践)
- データセットを移動して探索/Explore(探索)機能を使って分析アクションの展開
- LookMLの解説
- ビューファイル=モデル定義
- モデルファイル=ビューをどのように扱うのか
- 再利用や拡張を意識した作り
- Gitリポジトリとの連携で定義をバージョン管理出来る
- LookMLの仕組み自体は非常にシンプル。SQL毎の方言の違いも吸収出来る(LookML側でやってくれる)ので、LookMLを覚えるメリットは非常に大きいと言える
セッションまとめ
- データ活用方法は移り変わる。データソースも利用者も変わる
- データの可視化はゴールではなく、出発点。過去データを見て終わりではなく、正確なデータをリアルタイムに捉え、サービスへ転換
- ツールにワークフローを寄せるのではなく、理想的なワークフローにツールを寄せる
-
Lookerのアプローチ
- Lookerはデータを貯めているところに対して、横たわるような形で『アジャイルモデリングレイヤー』として存在、Lookerはあくまで各データソースに対してデータを取得しに行く、SQLを発行しにいく『SQL発行屋さん』。発行した結果を、様々なデータ活用方法で連携/展開していく。
Lookerブース
今回のランチセッションと合わせて、Looker社様にはイベントブースフロアにてブースも頂いておりました。
当日は多くのお客様にお越し頂き、Looker社の皆様も各種説明や問い合わせ対応等を行っておられました。(※以下、セッションの合間にお邪魔した時の写真です)
まとめ
という訳で、Developers.IO 2019スポンサーセッション、Looker蓮池様による『第3世代BI Lookerの魅力とは』のレポートでした。当日御覧頂いた皆様としては、Lookerのスタンスやビジョン、また実際に動いているLookerの画面を見ることでイメージが膨らんだ部分もあるかと思います。関係者の皆様、ありがとうございました!